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Die vorliegende Erfindung betrifft das Gebiet der automatischen Textverar- 
beitung* Insbesondere befaJSt sich die Erfindung mit einem Textverarbei- 
5 tungssystem und Verfahren zur automatischen Feststellung einer bestimmten 
Art von Fehlern, die in einem VerstojB gegen bestimmte Regeln uber den Ge- 
brauch von Einheiten besteheri, in einem gegebenen Text. 

In einigen herkQmmlichen Textverarbeitungssystemen ist es mSglich, 
1 0 Schreibfehler mit Hilfe eines sogenannten Rechtschreibprozessors festzustel- 
len, Der Rechtschreibprozessor uberpruft jedes Wort des Textes anhand ei- 
nes WOrterverzeichnisses. Wenn ein Wort des Textes nicht mit irgendeinem 
Wort des WOrterverzeichnisses identifiziert werden kann, so wird geschlos- 
sen, daj3 dieses Wort falsch geschrieben ist, Einige Rechtschreibprozessoren 
15 sind sogar in der Lage, den Schreibfehler automatisch zu korrigieren, iridem 
das falsch geschriebene Wort durch ein Wort aus dem WSrterverzeichnis er- 
setzt wird. Urn das richtige Wort im WGrterverzeichnis herauszufinden, sirid 
ausgefeilte Berechnungsmethoden entwickelt worden, die auf einer Analyse 
von Ahnlichkeiten zwischen den Wortern und/oder einem statistischen An- 
20 satz unter Berucksichtigung der verschiedenen Auftrlttsh&ufigkeiten be- 
stimmtef Arten von Schreibfehlern oder gar auf einer Analyse des Kontextes 
des falsch geschriebenen Wortes unter Ausnutzung der Redundanz des Textes 
basieren. 

25 Aus Research Scientific and Application Industry, Band 10, Nr. 3, Oktober 
1957, Seiten 383-389, LK. Belskaja: "Machine Translation of Languages" 1st 
ein Saizanalysesystem bekannt, das verschiedene Arten voii Wdrterverzelch- 
nissen aufweist, die entsprechend dem Quellentext herangezogen werden, 
Darin hat ein bestimmtes zu tibersetzendes Wort nur eine Bedeutung und 

30 wird unzweideutig als ein zu tibersetzendes Wort interpretiert, 

Aus EP-0 093 249 ist ein System zur Feststellung und Korrektur von kontext- 
bezogenen Fehlern in einem Textverarbeitungssystem bekannt, bei dem S&t- 
ze von fehlertrachtigen Datensegmenten zusammen mit Kontextmerkmalen 
gespeichert sind. Der jedes fehlertr&chtige Datensegment umgebende Text 
in einem Dokumeht wird mit den definierten Kontextmerkmalen verglichen, 
und im Fall der Nichtvereinbarkeit wird das fehlertrachtige Datensegment 
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hervorgehoben, Auf der Anzeige wird eln Satz von auf das hervorgehobene Da- 
tensegment bezogenen Datensegmenten angezeigt* 

In Verbindung mit der Verwendung von Einheiten und GroJSen, beispielswei- 
5 se in einem wissenschaftlichen Text wird jedoch hSuflg elne Anzahl speziel^ 
ler Probleme und entsprechend eine Anzahl spezieller Fehler und Unrichtig- 
keiten angetroffen, die von den bekannten Rechtschrelbprozessoren nicht 
behandelt werden kOnnen, 

10 Vor einer detaillierten Analyse dieser Arten von Fehlern t die in Verbindung 
mit Einheiten auftreten kOnnen, erscheint es zweckmaj5ig t klare Deflnitionen 
fur die Begriffe der Einheit und GrSJSe anzugeben, wie sie in dieser Beschrei- 
bung verstahden werden. 

15 Eine GrOJ3e ist definiert als ein Merkmal oder eine Eigenschaft eines Objek- 
tes, die quantitativ beschrieben werden kann* Solch eine quantitative Be- 
schreibung ist das Ergebnis der Bestimmung des Verhaitnisses zwischen der 
GrOJJe und einer bestimmten Bezugsgr6J5e, Die BezugsgrOJSe wird "Einheit" 
genannt, und das VerhSltnis wird "Zahlenwert" der GrOJ3e genannt 

20 

GrfiJJen k5nnen nach Arten yon Gr6J5eii grupplert werden* Zwei GrQfien sind 
definitionsgemajj von derselben Art, wenn sie miteinander verglichen wer- 
den k6nnen, d.h*, wenn sie mit derselben Einheit verglichen werden kOnnen. 
Das Produkt oder der Quotient von zwei GrCtfen derselben Art oder verschie- 
25 dener Arten ergibt eine neue GrSj3e einer anderen Art. Somit gibt es eine 
Vielzahl yon mathematischen Beziehungen zwischen verschiedenen Arten von 
GrOJ3en und zwischen den zugehSrigen Einheiten* Innerhalb eines speziellen 
Anwendungsgebietes ist es mOglich, einen Satz von BasisgrOJ3en in soteher 
Weise zu bestimmen, daJJ alle in diesem Anwendungsgebiet auftretenden Gr6- 
30 J3en als ein Produkt geschiieben werden kOnnen, das aus BasisgrOJ3en mit be- 
stimmten posltiven oder negativen Potenzen besteht. Dieses Produkt (oder 
der Satz der Potenzen jeder Basisgr0j3e in diesem Produkt) wird Dimension 
der Gr6J5e genannt 

35 Ein Einheitensystem wird aufgestellt, indem Basiseinheiten fur die Basisgr&- 
JJen bestimmt werden. und unter der Dimension einer Einheit wird die Di- 
mension der zugehflrigen Art yon Gr6J3en verstanden. 



Wenn als Beispiel zur Illustration der oben gegebenen Deflnitlonen die Gr6J5e 
der Kraft 

5 N (5 Newton) 

betrachtet wlrd, so 1st die Art der GrOfie "Kraft", der Zahlenwert 1st 5, die 
5 Einheit ist Newton und die Dimension der Einheit ist kg-m-s*" 2 , wobei kg, m 
und s die Basis-SI-Einheiten fur Masse, LSnge und Zeit sind. 

Obgleieh das obige Beispiel aus dem Gebiet der Naturwissenschaften entnom- 
men wurde, versteht es sich, daJ3 der Begriff der Einheiten und die Anwend- 

10 barkeit der vorliegenden Erflndung nicht auf das Gebiet der Naturwissen- 
schaften beschrankt ist* Die Grundgedanken der vorliegenden Erflndung 
kftnnen in Jedem Anwendungsgebiet angewandt werden, in dem quantitative 
Beschreibuiigen verwendet werden, beispielweise im Finanzwesen (Wah- 
rungseinheiten) t in Kochbtichern, bei der Lagerveiwaltung (Anzahl von Arti- 

15 keln pro Schachtel) usw/. 

In einem gegebenen Anwendungsgebiet existiert im allgemeinen eine Viel- 
zahl von verschiedenen Einheitensystemen, und Jede Art von GrOJ3e kann 
durch eine grqjSe Vielzahl unterschiedlicher Einheiten beschrieben werden. 

20 Die Verwendung von Einheiten und Einheijtensystemen wird durch verschie- 
dene Normen geregelt* Wahrend einige dieser Normen nur In bestimmten 
geographlschen Regionen oder bestimmten Anwendungsgebieten anwendbar 
sind, beruhen andere Normen wie etwa die Si-Norm auf einem Internationa- 
len Obereinkommen und haben einen breiten Anwendungsbereich, Die Ver- 

25 wendung der Si-Norm Ist von vielen nationalen und internationalen BehOrden 
vorgeschrieben. Nach dieser Norm sind einige aitere Einheiten yerboten, und 
einige sind nur in bestimmten wissenschaftlichen Disziplinen erlaubt Jedoch 
werden vlele Einheiten oder Einheitensysteme, die nach der Si-Norm verbo- 
ten sind, nlchtsdestoweniger in der Praxis h&ufig benutzt 

30 

Wenn fiir einen Text die Verwendung einer bestimmten Norm vorgeschrie- 
ben ist, kOnnen folglich vlele Fehfer auftreten, die in der Verwendung einer 
verbotenen Einheit bestehen, wahrend die Schreibweise des Namens oder 
des Symbols fur die Einheit korrekt sein mag. Wenn eine GrftBe, die mit Hilfe 
35 einer verbotenen Einheit beschrieben wurde, in einer zuiassigen Einheit aus- 
gedrtickt werden soli, ist es im allgemeinen notwendig, den Zahlenwert 
(oder die Zahlenwerte) gem3J3 einer bestimmten Umwandungsformel zu 
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&nd em. 

Eine weitere wichtige Art von Fehlern betrifft die Bezeichnung der Einhei- 
ten, die ebenfalls der gegebenen Norm entsprechen muj3. Im Gegensatz zu ei- 
5 nem normalen Wort kann eine elnzelne Einheit auf zahlreiche verschiedene 
Weisen bezeichnet werden. Die Basiseinheiten und einige abgeleitete Einhei- 
ten kOnnen entweder durch einen speziellen Namen oder ein spezielles Sym- 
bol bezeichnet werden. Die abgeleiteten Einheiten konnen aujSerdem durch 
verschiedene Kombinationen von Namen oder Symbolen bezeichnet werden. 
10 Im Fall einer Kombination von Symbolen kann auch das Layout vartiert wer- 
den. 

Beispielsweise geben die folgenden Ausdrucke all e dieselbe Einheit, namlich 
die Einheit "Watt" an. 

15 

(a) W 

(b) Js" 1 

(c) Js' 1 

(Es 1st zu beachten, daJ3 (b) und (c) in einem Textverarbeitungssystem nicht 
20 automatisch als identisch erkannt werdenl) 

(d) J/s 

(e) N-m/s 

(f) m 2 kg s-3 

(g) Watt 

25 ( n ) Joule pro Sekunde 

Im allgemeinen sind nur einige der mOglichen Bezeichnungen nach der gege- 
benen Norm zulassig oder gebrauchlich. AuSerdem sollten die Regeln zur Be- 
stimmung des Layouts fur den gesamten Text konslstent sein. Manchmal 
30 mussen sogar Mehrdeutigkeiten in der Bezeichnung aufgelSst werden (z.B.: 
kg/(hayr) anstelle von kg/ha/yr). 

Eine weitere spezielle Art von Fehlern betrifft die Verwendung von Prafixen 
wie etwa "m" fur "milli", "k" fur "kilo" und dergleichen. Beispielsweise muj3 
35 das Auftreten von mehr als einem Praflx in Verbindung mit demselben 
Symbol vermieden werden, und die Verwendung von Prafixen sollte an die 
Gr63endrdnung des Zahlenwertes angepaiJt sein, um unhandliche Ausdrucke 
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wle 0,0001 km zu vermeiden. 

In einigen Fallen 1st die Dimension einer In dem Text verwendeten Einheit 
nicht mlt der zu beschreibenden GroJ3e vereinbar, oder die Dimension exi- 
5 stiert in dem Anwendungsgebiet nicht. 

Ein weiteres Beispiel fur Fehler t die in Verbindung mit Einheiten auftreten, 
1st die Vermischung von Symbolen zur Bezeichnung der Einheit mit dem Na- 
men des zu messendjen Objekts (z.B.: "kg Trockentnasse pro ha"). Urn diese 
10 Fehler zu beseitigen, mu3 im allgemeinen der gesamte Satz ge&ndert werden, 

Wenn Fehler der oben als Beispiel angegebenen Arten In einem Dokument 
festgestellt und korrigiert werden sollen, so mu£ der Text vom Herausgeber 
oder Autor durchgesehen werden, Dies 1st eine zeitraubende und mfihsame 
15 Besch&ftigung. 

Es 1st deshalb eine erste Aufgabe der Erfindung, ein Textverarbeitungssystem 
und Verfahren zur automatischen Feststellung wenigstens der h&ufigsten die- 
ser Fehler zu schaffen, 

20 

GemSJS der Erfindung wird diese Aufgabe durch das in Anspruch 1 angegebe- 
ne Verfahren gelOst. 

Die in Anspruch 1 angegebenen Schritte a) bis c) sind vorbereitende Schrit- 
25 te, die ausgefQhrt werden mussen, bevor ein Text oder eine Anzahl von Tex- 
ten in dem Textverarbeitungssystem zu Qberprufen 1st, Die Information, die 
zum Aufflnden des Ortes einer Angabe einer Einheit in dem Text, zur Inter- 
pretation der Angabe und zum Identifizieren der Einheit benfltigt werden, 
wird in Schritten a) und b) gespeichert 

30 

In Schritt a) wird eine Liste vori Symbolen gespeichert, die zur Bezeichnung 
einer Einheit verwendet werden kGnnen. Wenn nur die Bezeichnung von Ein- 
heiten zu tiberprufen ist t reicht es aus, die Symbole der zuiassigen Einheiten 
zu speichern. Wenn verbotene Einheiten In ( dem Text zu beseitigen sind, 
35 mussen auch die Symbole fur verbotene Einheiten gespeichert werden. Wahl- 
weise kfinnen zusfitzlich zu den Symbolen die vollst&ndigen Namen der Ein- 
heiten gespeichert werden. 



Im aUgemeinen 1st zur zuverl&ssigen Interpretation der Angaben von Einhei- 
ten zusatzliche Information erforderlich, Beispielsweise kann es vora Kdntext 
abhangen, ob eln Symbol tats&chlich fur eine Einheit steht oder ob es eln ge- 
wahnliches Wort oder Tell eines gew&hnlichen Wortes 1st Da aufierdem eine 
Einheit hfiufig durch einen Ausdruck bezeichnet werden wird, der aus meh- 
reren Symbolen oder Namen von Einheiten besteht, 1st es notwendig, alle 
Symbole oder Namen. die zu dlesem Ausdruck gehSren, zu erfassen und die 
Bezlehung zwlschen ihnen zu analysieren. Die Kriterlen fur die Entscheidung, 
ob eln Symbol elne Einheit bezeichnet - allein oder in Kombinatlon mlt ande- 
ren Symbolen - und ftir das Identifizleren der Einheit werden in Schrltt b) 
gespeichert Die Auswahl dies er Kriterien 1st von dem Anwendungsgebiet ab- 
h&ngig. Es 1st jedoch m6glich, einige typische Beispiele fOr nutzliche Krite- 
rien anzugeben: 

Es 1st mOglich, Namen oder Symbole zu spezifizieren, die stets als Ein- 
heiten interpretiert werden miissen, wenn sie allein stehen oder mit ei- 
nem Prafix komblniert sind* 

- Einheiten in Formeln werden haufig In Drucktypen angegeben, die von 
den fur den Text verwendeten Drucktypen verschieden sind, 

- Wenn elne Zeichenkette, d.h., eine Folge von Schriftzeichen zwlschen 
Leerzeichen, nur aus Symbolen fur Einheiten besteht und kein gewdhnli* 
ches Wort 1st, das in einem W6rterverzeichnis gefunden werden kann, so 
kann sie als das Produkt der durch die einzelnen Symbole angegebenen 
Einheiten interpretiert werden, 

Wenn einzelne Symbole (die von einem Exponenten begleltet sein k6n- 
nen) durch Leerzeichen, Malpunkte oder Y), einen Schragstrich 
(V M ) oder dergleichen getrennt sind, oder wenn Namen von Einheiten 
durch das Wort "maT oder "pro 11 getrennt sind, so kann in £hnlicher Wei* 
se der gesamte Ausdruck als ein Produkt oder eln Quotient der einzelnen 
Einheiten interpretiert werden. 

Weitere leistungsfahige Interpretations kriterien kOnnen sich aus der 
syntaktlschen Struktur des Textes ergeben. Wie im Stand der Technik 
bekannt 1st, kann die syntaktische Struktur eines Satzes mit Hilfe eines 



sogenannten Parsers analysiert werden, der die Bestandteile elnes Satzes 
und die syntaktische Kategorie der einzelnen Bestandteile bestimmt We- 
gen der Beschr&nkungen fur mSgliche syntaktische Kategorien fur eine 
Einheit kann ffir viele Zeichenketten des Satzes entschieden werden, 
5 daJ5 sie nicht als eine Einheit interpretiert werden dftrfen, Andererseits 

kann ein Symbol oder eine Kombination von Symbolen positiv mit einer 
Einheit identiflziert werden, wenn sie syntaktisch direkt auf eine Zahlen- 
angabe (die den Zahlenwert der Gr6j5e angibt) oder auf ein die GrOJ3e an* 
gebendes Stichwort bezogen Ist In den meisten Fallen genugen die PosI- 
1 0 tionen von Angaben von GrfiJBen, Zahlen und Einheiten in einem Satz ei- 
nem verhaitnismafiig einfachen Schema (z + B.: " Eine Masse von 1 kg un- 
terliegt einer Gravitations kraft zwischen 9.79 und 9.82 N "). Es ist des- 
halb m6glich t einfache Kriterien aufzustellen (z.B M daJ3 eine Zahl dem 
Symbol ftir die Einheit unmittelbar vorausgeht), die uberprftft werden 
15 kOnnen, ohne dafi viel Rechenzeit verbraucht wird. Wenn andererseits 
die vollst&ndige syntaktische Struktur elnes Satzes mit Hilfe einfes Par- 
sers analysiert wird, ist es sogar moglich, verhaitnismaj3ig komplexe 
Strukturen korrekt zu interpretleren. Zum Beispiel in dem Satz: 
"Spitzen-Ausbringungsraten reichen von bis zu 0*012 im Herbs t bis nur 
20 0,002 kg N/ha/d im Winter", 

Es ist zu erkennen, daJ3 die GrOJ3e die Ausbringungsrate (von Stickstoff 
(N)) ist und dafi die zu den beiden Zahlen 0,012 und 0,002 gehOrende 
Einheit kg/(ha*d) i$t. 

25 In Schritt c) wird speziflziert, welche Einheiten und Bezeichnungen von Ein- 
heiten zulassig sind. Vorzugsweise werden diese Spezifikationen in Oberein- 
stimmung mit einer oder mehreren offlziellen oder inofflziellen Normen ge- 
macht, und die entsprechende Information wird so gespeichert, dajS der Be- 
nutzer im Normalbetrieb nur zwischen verschiedenen Normen wahlen kann, 

30 aber nicht die normgemaflen Vorschriften andern kann, 

Um die zuiassigen Einheiten zu spezifizieren, ist es miiglich, eine Liste von 
Symbolen der zuiassigen Einheiten zu speiehern oder fur Jedes der in Schritt 
a) gespeicherten Symbole ein en logischen Wert zu deflnieren. Alternativ kan- 
35 nen alle Einheiten so wie zugehOrige Informationen (Zulassigkeit, mSgliche 
Bezeichnungen- Dimension. Art der Gr6J3e und dergleichen) in dem Textver- 
arbeitungssystem in einer internen Reprasentation gespeichert werden. 
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Au£erdem kann ein Satz von Regeln fur den Aufbau zul&ssiger Bezeichnungen 
fQr abgeleitete Einheiten gespeichert werden. Zusatzliche Information, die in 
Schritt c) spezifiziert werden kann, bezieht sich auf die Verwendung von Pr&- 
fixen und das gewtinschte Layout der Bezeichnung von Einheiten, Diese Infor- 
5 mation kann in solcher Weise gespeichert werden, daJ3 der Benutzer frei zwi- 
schen verschiedenen Layoutiypen wahlen kann, die nach der ausgew&hlten 
Norm zulSssig sind. 

Nachdem die oben beschriebenen vorbereltenden Schritte abgeschlossen 
10 sind, wird ein gegebener Text iiberpruft, indem die in Anspruch 1 angegebe- 
nen Schritte d) bis fl aufgefuhrt werden. 

In Schritt d) wird der Text unter Verwendung der in Schritten a) und b) ge- 
speicherten Informationen nach Angaben von Einheiten durchsucht* 

15 

In einem direkten Zugang kann dies dadurch geschehen, daJ3 aufeinanderfol- 
gend jede Zeichenkette des Textes untersucht wird. Dies hat den Vortell. 
daJ3 jede Angabe einer Einheit mit Sicherheit festgestellt werden kann. 

20 Andererseits wird es in vielen Anwendungen vorzuziehen sein, einen indirek- 
ten Zugang zu w&hlen. 

Gtm83 eirier bevorzugten Ausffihrungsform der Erflndung wird der Text zu- 
n&chst nach Zahlen (Zeichenketten, die nur aus Ziffern bestehen) durch- 

25 sucht, und nur die Zeichenketten unmittelbar hihter einer Zahl werden dar- 
aufhin tiberprftft, ob sie als eine Einheit in terpretiert werden k&nnen. Eine 
statistische Analyse hat ergeben, daJS durch dieses Verfahren in einem durch- 
schnittlichen Text mehr als 95 % aller Angaben von Einheiten erf^St werden 
kGnnen. Da Zahlen in einem Textverarbeitungssy stern recht einfach festge- 

30 stellt werden kSnnen, ftihrt dieses indirekte Suchverfahren zu einer drasti- 
schen Verringerung der Verarbeitungszeit. In speziellen Anwendungsgebie- 
ten. beispielsweise im Finanzwesen, kann es auch erforderlich sein. die Zei- 
chenketten unmittelbar vor der Zahl zu tiberprufen. 

35 Alternativ kann der Text ztinSchst nach Angaben von GrOJ3en durchsucht wer- 
den, indem die Zeichenketten mit einer Tabelle von SchlusselwOrtern und 
Symbolen oder Erzeugungsregeln, die sich auf Gr6J3en bezieheh, verglichen 
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werden. Dann brauchen nur die Zeichenketten In einer bestlmmten Umge- 
bung der Gr6J3e darauf uberprQft zu werden, ob sie Einheiten bezeichnen. 

Gem&3 einem weiteren indirekten Zugang werden die Zeichenketten des 
5 Textes mit einem WOrterverzeichnis verglichen, und wenn eine Zeichenkette 
als ein "normales" Wort identifiziert wird, wird nicht versucht t die Zeichen- 
kette als eine Einheit zu interpretieren* Dieser Ansatz 1st besonders vorteil- 
haft, wenn das erfindungsgemaj3e Verfahren mit der Verwendung eines her- 
kdmmlichen Rechtschreibprozessors kombiniert wird. In diesem Fall kann 
1 0 das WOrterverzeichnis des Rechtschreibprozessors verwendet werden, sofern 
spezielle Vorkehrungen fur diejenigen W&rter des WOrterverzetchnisses ge~ 
troffen werden, die dieselbe Schreibweise wie ein Name oder ein Symbol ei- 
ner Einheit oder eirier Kombination/Zusammensetzung von Einheiten haben. 

15 Wenn eirie Angabe einer Einheit in Schritt d) lokalisiert und interpretiert 
worden 1st, wird in Schritt e) Qberpruft. ob die Einheit und/oder die Bezeich- 
nung derselben zul&ssig ist. Dies wird allgemein bewerkstelligt, indem flber- 
prfift wird, ob die in Schritt c) spezifizierten Regeln erfullt sind. Zum Beispiel 
wird zunachst uberprQft, ob die Einheit, die durch die in Schritt d) gefunde- 

20 ne Zeichenkette bezeichnet wird, eine Dimension hat. die tats&chlich in dem 
Anwendungsgebiet (z.B, der Natur) auftritt und/oder mit der Dimension der 
Grftfie vereinbar ist. auf die sie in dem Text bezogen ist. Dann wird eine ge- 
eignete zuiassige Einheit derselben Dimension ausgew&hlt und eine zuiassige 
Bezeiclmung derselben aufgebaut. SchlieJSlich wird fiberprQft, ob die aufgebau- 

25 te Bezeichnung mit der Im Text gefundenen identisch ist. 

Falls die OberprOfung In Schritt e) einen Fehler erglbt, wird in Schritt f) ein 
Fehlersignal erzeugt 

30 Bei einer speziellen Ausfuhrungsform des Verfahrens nach Anspruch 1 kOn- 
nen in Schritt a) nur die verbotenen Einheiten gespetchert werden. In die- 
sem Fall wird in Schritt c) festgelegt daJ3 alle Einheiten verboten sind. Der 
Schritt e) ist dann trivial, und ein Fehlersignal wird erzeugt, sobald in Schritt 
d) eine Angabe einer verbotenen Einheit gefunden wird, 

35 

Das Fehlersignal kann dem Benutzer angezeigt werden, so dsJ3 von dem Be- 
nutzer eine notwendige Korrektur vorgenommen werden kann. 
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Vorzugsweise wird jedoch eine yorgeschlagene Korrektur ebenfalls dem Be- 
nutzer angezeigt und/oder automatlsch ausgefuhrt Wenn die Elnheit durch 
elne andere ersetzt wird, wird auch uberpruft, welche Zahl oder Zahlen zu 
dleser Einhelt gehOren, und der Zahlenwert dieser Gr6J5e wird In tfbereln- 
5 stlmmung mit einer vorgegebenen Umwandlungsformel angepaJ3t, Wenn elne 
Syntaxanalyse ausgefuhrt worden ist, kann die darin enthaltene Information 
ausgewertet werden, um die Zahlen zu Identiflzieren. die zu der Elnheit ge- 
hdren. 

10 Ein bevorzugtes Ausfuhrungsbeispiel der Erflndung wird nachfolgend im Zu- 
sammenhang mit der Zeichnung eriautert 

Die einzige Zeichnung 1st ein FlnJ3diagramm, das ein Verfahren zur Oberpru- 
fung, ob die Verwendung von Einheiten und Gr6J5en in einem Text der SI- 
15 Norm eritspricht, illustriert. 

In dem gezeigten Ausfuhrungsbeispiel wird angenommen, daji Hintergrund- 
informatlon bezuglich der Symbole fur Einheiten, zuiassiger Einheiten, zui&s- 
siger Dimensionen, Interpretationskriterien, Formeln zur Umwandlung von 
20 Einheiten, SchlQsselw5rtern, Symbolen und Dimenslonen von GrOJ3en und 
derglelchen vorab gespeichert worden 1st. 

1- Optionen Bemerkung: dies ist ein Beispiel (SI) 

25 In Schritt 10 wird eine Anzahl von Optionen durch den Benutzer ausgewShlt. 
die verfugbaren Optionen b£ziehen sich auf die folgenden Probleme: 

1. 1 Die Sprache des Dokuments. 

30 Diese Information wird benStigt zur Interpretation von Schlusselw6rtem und 
zur Handhabung von Besonderheiten der Sprache wie etwa die Notation von 
Zahlen, Weiterhln kann die Liste von Einheiten verkurzt werden, weil einige 
verbotene Einheiten in bestimmten Sprachen nicht auftreten, 

35 1.2 Vollst&ndige Namen von Einheiten. 

In dem meisten Fallen muJ3 eine vollstAndig ausgeschriebene Elnheit durch 
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ihr Symbol erset2t werden. Manchmal 1st jedoch ein Name zuiassig (z.B. 5 
Jahre). 

1.3 Das Layout der der Einheiten* 

5 

Es gibt drei Arten der Bezeichnung von Einheiten. Eine von ihnen mufi kon- 
sistent in dem gesamten Dokument verwendet werden. 

Ein Puixkt als Trenner und ein Schrfigstrich ("/") im Fall der Division, 
Beispiel: kg/(hayr) 

Ein Punkt als Trenner und negative Potenzeh im Fall einer Division, 
Beispiel; kgha-^yr" 1 . 

15 3. Ein Leerzelchen als Trenner und negative Potenzen im Fall einer 

Division, 

Beispiel: kg ha" 1 yr" 1 , 

1-4 Das Layout der Potenzen, 
20 . 
1.5 Die Bezeichnung von Prozentwerten. 

Das %-Zeichen kann an die Zahl angehangt* oder von dieser durch ein Leer- 
zelchen getrennt sein. Einer dieser Modi mufi in dem Dokument konsistent 
25 angewandt werden. Wenn ein Fehler auftritt, wird dieser ohne jegliche Er~ 
w&hnung korrigiert. 

2. Suche nach Angaben von Einheiten 

30 Urn den Ort einer Einheit in dem Text zu find en, wlrd der Text zunachst 
nach Zahlen durchsucht (Schritte 12-16) und anschlieJ3end wlrd tiberpruft, 
ob die nachste Zeichenkette oder die n&chsten Zeichenketten als Einheiten 
interpretlert werden k6nnen (Schritte 18 bis 26), 

35 2,1 Suche nach Zahlen 

In Schritt 12 werden die einzelnen Zeichenketten des Textes eine nach der 
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anderen durchgegangen, und es wlrd uberpruft, ob eine Zeichenkette eine 
Zahl darstellt Es wird angenommen t daJ3 eine Zeichenkette eine Zahl dar- 
stellt, wenn sie ZiiTern, aber kelne Buchstaben enthait (z.B,: 1.735,8). Etaige 
wenige Ausnahmen {spezielle Buchstabensequenzen zur Darstellung spezieller 
5 Zeichen gem£J3 dem SGML-Standard) slnd zugelassen. 

In einer abgewandelten Ausfuhrungsform 1st der Begriff der Zahl verall- 
gemetaert, so daJ3 Wflrter oder Buchstabensequenzen, die sich auf Zahlen 
oder Mengen beziehen, wie etwa "funf 1 , "Million" t "ein Dutzend", "einige" 
1 0 ebenfalls erkannt werden. 

Um den Wert der Zahl festzustellen (fur etwaige Umwandlungen) raufl die 
MOglichkeit berticksichtigt werden, daji eine Zahl mehr als eine Zeichenket- 
te umfaJ3t (z.B, 60*000), Aus dies em Grund wird flberpruft, ob die nachste 
15 Zeichenkette mit einer Ziffer beginnt, 

Ein spezielles Problem im Zusammenhang mit der Bestlmmung des Wertes 
einer Zahl besteht in der Mehrdeutigkeit in der Notation von Tausendern 
und Dezimalstellen. In der englischen Sprache wird ein Komma als Trenner 

20 fur Tausender verwendet (z.B. 100.000), und ein Punkt wlrd far Nachkomma- 
stellen verwendet (z.B. 1.6). Einige Autoren verwenden jedoch einen Punkt 
als Trenner far Tausender und ein Komma fur Nachkommastellen, In einigen 
Sprachen, beispielsweise in Deutsch oder Niederl&ndisch, wird ein Leerzei- 
chen zwischen Tausendern und ein Komma fur die Nachkommastellen ver- 

25 wendet. Doch auch in diesen Sprachen wird h£ufig ein Punkt fur Nachkom- 
mastellen verwendet. Um die korrekte Interpretation zu finden, mtissen indi- 
viduelle oder allgemeine Instruktionen durqh den Benutzer gegeben werden, 
Alternativ wird der gesamte Text nach Zahlen durchsucht, und es wird an- 
hand einer statistischen Analyse entschieden, welche Notation von dem Autor 
30 benutzt worden 1st. Normen fur das Layout von Zahlen sind ebenfalls verfiig- 
bar. 

Wenn das Wort M billioii M als Angabe einer Zahl erkannt wird, mv& der Benut- 
zer bestimmen, ob es als 10 9 oder 10 12 interpretiert werden solh 

35 

Sehr grctfie oder sehr kleine Zahlen werden h&uflg als Produkt aus einer De- 
zimalzahl und einer Zehnerpotenz geschrieben {z.B. 2,4 x 10 5 }, Solche Aus- 
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drticke werden ebenfalls als eine Zahl erkannt und interpretiert. Ebenso, 
wenn ein Toleranzbereich etner Zahl durch Ausdrucke wle "±5" oder M (±5)" 
angegeben 1st, werden solche Ausdrticke als zu der vorangehenden Zahl gehfl- 
rig betrachtet, 

Nachdem elne vollstandlge Zahl festgestellt und identiflziert worden 1st, wlrd 
tiberprftft, ob dlese Zahl Tell elner Gruppe von zusammengehSrenden Zahlen 
1st, Zu dlesem Zweck werden die nachfolgenden Zelchenketten darauf uber- 
prfift, ob sie Zahlen angeben und durch Kommas, Semlkolons f Blndestriche 
Oder BindewSrter wle "und'\ "oder", "bis" usw/getrennt sind. In den weiteren 
Verfahrensschritten werden die Zahlen einer solchen Gruppe als elne Ge- 
samtheit behandelt 

Wenn eine Zahl (Gruppe von Zahlen) gefunden wurde, 1st es wahrscheinlich, 
da3 die Zelchenkette unmittelbar hinter dieser Zahl eine Elnheit bezeichnet. 
Es ist Jedoch auch mOglich, da6 die Zahl eine dimensionslose Gr6J3e darstellt 
und nicht von einer Einheit begleitet ist. Aus diesem Grund wird in Schrltt 
14 versucht, die Zahl als eine solche ohne Dimension zu klassiflzieren* 

Zu diesem Zweck wird wenigstens einer der folgenden Tests ausgeffihrt, und 
die Zahl wird als diraeilsionslose Zahl ausgegrenzt; wenn wenigstens einer 
der Tests erfdlgreich Ist, 

- Es wird Gberpruft, ob der Zahl das %-Zeichen folgt. 

Die Zelchenkette hinter und die Zelchenkette vor der Zahl werden mit 
einer Liste verglichen, die alle Namen von Monaten enthait, und die Zahl 
selbst wlrd darauf tiberpruft, ob sie ein Jahr reprasentiert Es wird ange- 
nommen, dafi eine Zahl ein Jahr reprasentiert, wenn auf vier Ziffern, von 
denen die ersten beiden "19" sind, eine geschlossene Klammer oder 
Oder folgt. 

Die Zelchenkette vor der Zahl wird mit einer Liste von SchltisselwOrtern 
wle "Tabelle", "Figur'\ "Kategorie" und dergleichen verglichen. 

Die Zelchenkette unmittelbar hinter der Zahl wird mit einem WOrterver- 
zeichnis verglichen, urn diese Zelchenkette als ein normales Wort zu 
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klassifizieren. Das WOrterverzeichnis 1st so gestaltet, daJ3 normale W6rter, 
die in der gleichen Weise wie eine Elnheit geschrieben werden, ausgelas- 
sen oder speziell raarkiert sind. 

5 Wenn sich ergibt, dajS die Zahl eine dimensionslose GrOjSe angibt, wird die 
Suche nach Zahlen mit Schritt 12 fortgesetzt, Anderfalls wird in Schritt 16 
ein Korrekturflag zuruckgesetzt, 

2.2 Interpretation der Zeichenketten unmittelbar hinter der ZahL 

10 

Wenn ill Schritt 12 eine Zahl gefurtden wurde und der Dimensionstest pdsitiv 
1st, wird in Schritt 18 versucht, die Zeichenkette unmittelbar hinter dieser 
Zahl als eine Einheit zu interpretieren, Zu diesem Zweck wird die Zeichen- 
kette mit einer Liste von Namen und Symbolen fur Einheiten verglichen. 

15 Wenn die Zeichenkette mit einem Namen oder einem Symbol einer Einheit 
identisch 1st, wird sie als diese Einheit interpretiert und die Dimension der 
Einheit wird in einem Register gespeichert In einigen Fallen mag die Zei- 
chenkette als solche mehrdeutig sein t so da3 sie nicht zwingend als eine Ein- 
heit interpretiert werden mu£. BerQcksichtigt man jedoch, daJ3 die Zeichen- 

20 kette unmittelbar nach einer Zahl auftritt, 1st die Interpretation als eine Ein- 
heit vernunftig* 

In ahnlicher Weise wird die Zeichenkette als eine Einheit interpretiert, 
wenn sie nur aus Symbolen fur Einheiten besteht t die durch Malpunkte, 
25 Schr&gstriche oder Potenzangaben getrennt sind T und die Dimension wird 
aus den Dimensioned und Potenzen der einzelnen Faktoren bestimmt. 

Wenn die Zeichenkette erfolgreich als eine Einheit Interpretiert werden 
konhte, wird die nachste Zeichenkette untersucht (Schritt 20) und der glei- 
30 chen Interpretatlonsprozedur unterzogen. Auf diese Weise kflnneri Einheiten, 
die sich uber mehr als eirie Zeichenkette erstrecken (z.B, M N m" oder "miles 
per hour"), vollstStndig erfaj3t werden. Die Dimension der vollst&ndigen Ein- 
heit wird aus den Dimensionen abgeleitet, die den einzelnen Zeichenketten 
zugeordnet wurden* 

35 

Wenn eine Zeichenkette in Schritt 18 nicht als eine Einheit interpretiert 
werden konnte. wird auf diese Zeichenkette in Schritt 22 eine Korrekturpro- 
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zedur angewandt. Diese Korrekturprozedur entspricht im wesentlichen der- 
jenigen, die in herkSmmlichen Rechtechreibprozessoren angewandt wird* Es 
werden Jedoch einige spezielle Vorkehrungen im Hinblick auf Fehler getrof- 
fen, die typischerweise in Verbindung mit der Schreibweise von Elnheiten 
5 auftreten, Wenn eine vernftnftige Korrektur verfiigbar 1st, wird in Schritt 24 
das Korrekturflag gesetzt, und die Interpretationsprozedur nach Schritt 18 
wird auf die korrigierte Zeichenkette angewandt. 

Wenn andererseits eine Korrektur nicht mOglich war, wird In Schritt 26 
10 flberprflft, ob die Zeichenkette, die nicht interpretiert werden konnte, die 
erste Zeichenkette hinter der Zahl war, Wenri sie nicht die erste Zeichenket- 
te war, wird gefolgert, d*U3 eine vollstandige Angabe einer Einheit gefunden 
worden 1st Wenn sie die erste Zeichenkette war f wird in Schritt 28 das Kor- 
rekturflag gesetzt, und die Suche nach Zahlen wird fdrtgesetzt (Schritt 12); 

15 

3, Prflfung auf Zulfisstyk^it der Einheit 

Wenn eine Angabe einer Einheit gefunden wurde, wird in Schritt 30 Hber- 
pruft. ob die Dimension dieser Einheit. die bei der Interpretationsprozedur 

20 bestimmt worden 1st, In einer Liste von Dimensioned die in dem Anwen- 
dungsgebiet tats&chlich auftreten, gefunden werden kann/ Zusfitelich wird die 
Umgebung der Einheit (zJB* der Satz, in dem die Einheit auftritt, oder eine 
vorgegebene Anzahl von Zeichenketten vor und hinter der Einheit) nach 
Schitisselw6rtern oder Symbcflen durchsucht, die sich auf Gr6J3en beziehen. 

25 Wenn ein solches Schlusselwort oder Symbol gefunden wird, wird die Dimen- 
sion der GrfiJ3e mit der Dimension der festgestellten Einheit verglichen. 
Wenn die Dimension der Einheit in dem Anwendungsgeblet nicht auftritt 
oder nicht mit der Dimension der zugehdrigen Gr5j3e konsistent 1st, wird er- 
neut versucht, die zu der Einheit gehOrende Zeichenkette zu korrigleren 

30 (Schritt 22), 

Wenn die Dimensionsuberprufung in Schritt 30 erfolgreieh war, wird in 
Schritt 32 gepruft, ob die Einheit und ihre Bezeichnung nach der Si-Norm 
zuiassig sind. Bei dieser Prufung werden die folgenden Krlterlen tiberpruft: 

35 

Sind alle Symbole, die in der Einheit auftreten, nach der Si-Norm 
zuiassig? 
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1st die Schreibweise als ein Produkt zuiassig Oder mussen elulge Oder al- 
le Faktoren durch spezlelle Symbole ersetzt werden (z3. "W" anstelle von 
"J-s" 1 ")? 

5 - Entspricht die Verwendung von Prafixen der Si-Norm? 

Wenn wenigstens eine dieser Anforderungen nicht erfGUt 1st, wlrd elne ent- 
sprechende zuiassige Einheit oder Bezeichnung in Schritt 34 ausgewahlt. 
Dann wlrd in Schritt 36 uberprflft, ob die Anderung der Einheit oder Be- 
10 zeichnung einen Einflufi auf den Zahlenwert der Gr6J3e hat. Erforderliqh je- 
denfalls wird ein neuer Zahlenwert fur jede der Zahlen berechnet, die zu der 
in Schritt 12 festgestellten Gruppe gehoren. 

Die Berechnung der neuen Zahlenwerte wird in Schritt 38 ausgefGhrt Ein 
15 Satz von Umwandlungsformeln, die die Beziehung zwischen den verbotenen 
Einheiten und den zuiassigen SI-Einheiten bestimmen. sind in einer Tabelle 
gespeichert. Im allgemeinen besteht die Umwandlung elnfach in einer Multi- 
plikation mit einem bestimmten Faktor* 

20 Es 1st nicht notwendig, Umwandlungsfaktoren fur jedes mGgliche Paar von 
Einheiten zu speichern. Wenn die festgestellte Einheit eine Potenz einer ver- 
botenen Einheit oder ein Produkt von Potenzen von verbotenen Einheiten 
1st, kann sie allgemein durch eine entsprechende Potenz oder ein Produkt 
von Potenzen vqn zuiassigen Einheiten ersetzt werden. In diesem Fall wer- 

25 den die Umwandlungsfaktoren zu derselben Potenz genommen wie die zuge- 
hSrigen Einheiten, und der Zahlenwert wird mit dem Produkt der Umwand- 
lungsfaktoren multipliziert Zum Beispiel wird die verbotene Einheit "pound- 
force per square inch" (Ibf in' 2 ) in die SI-Einhelt "Pascal" (Pa = N nT 2 ) um- 
gewandelt. Der Umwandlungsfaktor far ,r lbf 1 in "N" ist 4,448, und der Urn- 

30 wandlmigsfaktor fur "in" in "ra" ist 0,0254. Folglich ist der Gesamt-Umwand- 
lungsfaktor gegeben durch: 

4,448 • {0.0254)- 2 = 6,8944, so daJ3 die Gr8J3e 

35 "1 lbf in -2 " umgewandelt wird in "6,8944 Pa". 

In der wissenschaftlichen Literatur gibt die Anzahl von Dezimalstellen hinter 
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dem Dezimalkomma im allgemeinen die Genauigkeit an, mit der die entspre- 
chende GrOjie bestlmmt 1st. Zura Beispiel bedeutet die Bezeichnung "0,3 kg", 
dafi die Toleranz in der GroBenordnung von 10 g liegt wahrend die Bezeich- 
nung "0,300 kg" angibt, daji die Toleranz nur in der Grftflenordnung von eini- 
5 gen Zehntel Gramm liegt. Somit ist strenggenommen eine Umwandlung wie 

0,1 lb m 0,04536 kg 

irrefuhrend, obgleich der Zahlenwert korrekt ist. In diesem Beispiel gibt "0,1 
10 lb" eine Toleranz von ± 0,05 lb an, was etwa ± 0,03 kg entspricht, Folglich 
sollte der Zahlenwert fQr kg auf 0,045 gerundet werden. Aus diesem Grund 
werden die in Schritt 38 berechneten Zahlenwerte so gerundet, dafi die 
durch die letzte Dezimals telle hinter dem Dezimalkomma angegebene Tole- 
ranz der durch die ursprungliche Zahl angegebenen Toleranz entspricht 

15 

. \ Wenn die in Schritt 38 berechneten neuen Zahlenwerte viele Null-Digitalstel- 
len vor oder hinter dem Dezimalkomma aufweisen, werden Praflxe (fiir "mil- 
II", "kilo", "mega" und dergleichen in Obereinstimmung mit der SI-Norm zu 
der Einheit hinzugefugt oder davon entfernt. und der Zahlenwert wird mit 
20 einer entsprechenden Zehnerpotenz multipliziert oder dividiert 

Alternativ wird vorgeschrieben, daJ3 beispielsweise die Einheit "Meilen" stets 
durch "Kilometer" ersetzt wird, wahrend die Einheit "Inch" (Zoll) stets 
durch "Zentimeter" ersetzt wird, so daJS grojie Umwandlungsfaktoren ver- 
25 mieden werden. Dieses Verfahren 1st besonders vorteilhaft, wenn indirekte 
Zahl^nangaben in Schritt 12 erkannt wurden. In diesem Fall wird beispiels- 
weise "einige Zoll" umgewandelt in "einige Zentimeter" und nicht in "einige 
Meter". 

30 4- Korrektur des Lavouta 

Wenn in Schritt 32 gefunden wurde, dafi die Einheit und ihre Bezeichnung 
zuiassig sind, oder wenn in Schritt 36 entschieden wurde, daJ3 der Zahlen- 
wert [die Zahlenwerte) nicht geSndert zu werden braucht, oder wenn die 
35 neuen Zahlenwerte in Schritt 38 berechnet worden sind, werden die SI-Ein- 
heit und die zugehflrigen Zahlen in der zugelassenen Schreibweise und in 
Obereinstimmung mit dem vorgewahlten Layout (Schritt 40) geschrieben 



- 18 - 



und mit den ursprunglichen Zeichenketten vergllchen (Schritt 42). Wenn die 
neuen Zeichenketten, die in Schritt 40 geschrieben wurden, nicht mit den 
ursprunglichen Zeichenketten identisch sind, wird in Schritt 44 ein Korrek- 
turflag gesetzt. 

5 

5. Korrektur 

In Schritt 46 wird festgestellt. ob das Korrekturflag zu irgendeiner Zeit w&h- 
rend der oben beschrtebenen Prozedur gesetzt word en 1st Wenn das Korrek- 
10 turflag nicht gesetzt worden ist, wird die Suche nach Zahlen unmittelbar mit 
der nachsten Zeichenkette des Textes fortgesetzt (Schritt 12). In diesera 
Fall 1st die "nachste" Zeichenkette diejenige Zeichenkette, die in Schritt 18 
nicht als eine Einheit interpretiert werden konnte. 

15 Wenn eine vollstandige Zeile des Textes durch Wiederholung der Schritte 12 
bis 46 durchsucht worden 1st und wenn keine Korrektur in dieser Zeile er- 
forderlich war, so wird die Zeile beispielsweise auf einem Bildschirm ange- 
zeigt. 

20 Wenn in Schritt 46 ein Korrekturflag festgestellt wird, wird in Schritt 48 ei- 
ne Korrekturprozedur ausgefuhrt. In Abhangigkeit von einer InstrukUon des 
Benutzers kann die Korrektur automatisch oder durch Interaktion mit dem 
Benutzer ausgefuhrt werden. 

25 Im Fall der interaktiven Korrektur wird die Zeile, in der der Fehler festge- 
stellt wurde, dem Benutzer angezeigt, und die Zeichenketten, die korrigiert 
werden mQssen, werden -hervorgehoben. Zusatzlich wird die vorgeschlagene 
Korrektur, d.h., die in Schritt 40 geschriebene Folge von Zeichenketten, an- 
gezeigt. Dann wird durch den Benutzer entschieden, ob der ursprungliche 

30 Text ohne Korrektur beibehalten oder die vorgeschlagene Korrektur ausge- 
fuhrt werden soil, oder der Benutzer kann eine andere Korrektur eingeben. 

Der korrigierte Text wird in einer Ausgabedatei gesichert. 

35 Im Fall der automatischen Korrektur wird die Korrektur gemaJJ Schritt 40 
automatisch in der Ausgabedatei gesichert, und die alten Zeichenketten, die 
geldscht worden sind und die neuen Zeichenketten, die dafur eingesetzt 
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worden sind, werden durch geeignete Zelchen marklert. Wenn keine Kor- 
rektur verffigbar 1st. beispielsweise, wenn die Dlmensionsiiberprufung in 
Schritt 30 ergibt, daj3 die Einheit in dem Anwendungsgebiet nicht zu ftnden 
1st, selbst wenn alle KorrekturmOglichkeiten, uberpmft worden sind, und 
5 wenn die korrekte Dimension nicht aus dem Kontext bestimmt werden 
kann, wird keine Korrektur ausgefuhrt, und ein Fehlersignal wird dem Be- 
nutzer angezeigt. 

In einer modiflzierten Ausfuhrungsform des Korrekturprozesses hat der Be- 
10 nutzer die MQglichkeit, bestimmte Arten von Fehlern zu besUmmen, die 
automatiseh korrigiert werden sollen, wahrend andere Fehler interaktiv kor- 
rigiert werden. In einer noch weiter verfeinerten Version kann ein Lernpro- 
ze0 tastalliert sein, so daJ3, wenn der Benutzer einmal einer bestimmten Kor- 
rektur zugestimmt Oder diese veranlaJ3t hat, Fehler derselben Art automa- 
1 5 tisch analog zu dieser Korrektur gehandhabt werden. 



20 



25 



30 



35 
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P 37 50.135.6-08 

PATENTANSPRUCHE 

5 1. Verfahren zur Prufung des richtigen und konsistenten Gebrauchs von feh- 
lertrachtigen Datensegmenten in einer Kette von Datensegmenten in ein em 
Textverarbeitungssystem, mit den Schritten: 

(a) Speichern einer Liste von Symbolen, die fehlertriachtige Datensegmente 
reprasentieren, 

10 (b) Speichern von Kriterien, wie etwa typischen syntaktischen Strukturen in 
der Pezeichnung oder in derri Kontext, in dem fehlertrSchtige Datensegmen- 
te auftreten. die festlegen t ob ein Symbol oder eine Kombination von Symbo- 
len als ein fehlertrachtiges Datensegment interpretiert wird oder nicht, 

(c) Spe2iflzieren von zuiassigen fehlertrachtigen Datensegmenten und zuias- 
1 5 sigen Bezeichnungen derselben, 

(d) Durchsuchen des Textes nach Zeichenketten, die frgendwelche der auf- 
gelisteten Symbole enthalten, die als ein fehlertrachtiges Datensegment oder 
Teil eines fehlertrachtigen Datensegments interpretiert werden kdnnen. an- 
hand der gespeicherten Kriterien, 

20 (e) wenn eine solche Zeichenkette gefanden wird, vergleichen des zugehOri- 
gen fehlertrachtigen Datensegments und der vollstandigen Bezeichnung des- 
selben mit den in Schritt c) spezifizierten fehlertrachtigen Datensegmenten 
und Bezeichnungen und 

(f) Erzeugen eiries Fehlersignals, wenn das fehlertrachtige Datensegment 
25 oder die Bezeichnung nicht zuiassig ist t dadurch gekennzeichnet, daJ3 die 
fehlertrachtigen Datensegmente Einheiten sind und die in Schritt b) gespei- 
cherten Kriterien eine Uberprufung einschli^Sen, ob in einer vorgegebenen 
Umgebung der Zeichenkette entweder eine Zahlenangabe oder ein Schlussel- 
wort oder Symbol gefunden wird v das sich auf eine Gr£6e bezieht. 

30 

2, Verfahren nach Anspruch 1, bei dem zuiassige Einheiten spezifiziert wer- 
den, indem eine Liste von Symbolen fur zulassige Einheiten sowie Bildungs- 
regeln fur aus solchen Symbolen gebildete mogliche mathematische Aus- 
driicke (z.B. Produkte) gespeichert werden; 
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3. Verfahren nach Anspruch 2, bei dem fur jede in Schritt d) gefundene 
Elnheit elne Dimension berechnet wird und eine Einheit als unzuiassig be- 
trachtet wird, wenn ihre Dimension nlcht in dem Anwendungsgebiet auftritt 
oder von der Dimension der Gr6J5e verschieden 1st, die durch ein Symbol 

5 oder Schlusselwort angegeben wird, auf das sich die Einheit in dem Text be- 
zieht. 

4. Verfahren nach einem der Anspruche 1 bis 3, bei dem in Schritt d) der 
Text zunSchst nach Zahlen durchsucht wird und die Suche nach Elnhelten 

10 auf die Zeichenketten unmittelbar hinter elner Zahl oder einer zuvor gefun- 
denen Einheit beschr4nkt wird* 

5. Verfahren nach einem der Anspruche 1 bis 4, bei dem in Schritt d) die 
Zeichenketten mit einem WOrterverzeichnis vergllchen werden, aus dem alle 

15 WOrter entfernt worden sind. die dieselbe Schreibweise wle eine Einheit ha- 
ben, und bei dem eine Zeichenkette ohne Oberprufung weiterer Kriterien zu~ 
rQckgewiesen wird, wenn sle mit einem Wort des WOrterverzeichnisses iden- 
tifiziert werden kann. 

20 6. Verfahren nach etnem der vorstehenden Ansprttche, bei dem eine Zei- 
chenkette, die in Schritt d) nicht als eine Einheit interpretiert werden 
konnte, einer RechtschreibOberprOfung und einem Korrekturproz€# unterzo- 
gen wird und erneut anhand der Interpretationskriterien aberpruft wird, 
wenii die RechtschreibkorTektur ausgefuhrt worden 1st 

25 

7. Verfahren nach einem der vorstehenden Anspruche, bei dem Schritt c) 
einen Schritt der Speicherung einer entsprechenden zul&ssigen Einheit fttr 
jede unzuiassige Einheit enthait und bei dem, wenn eine Einheit oder Be- 
zeichnung in Schritt e) als unzuiassig gefunden wurde, die entsprechende zu- 

30 lassige Einheit und /oder Bezeichnung bestimmt wird. 

8. Verfahren nach Anspruch 7, mit den Schritten 

Speichern von Umwandlungsformeln zur Umwandlung unzulfissiger Ein- 
35 heiten in zuiassige, 

- Identiflzieren der Zahlenwerte aller Zahlen, ob sie einer Einheit zugeord- 
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net sind oder nicht und 

- Berechnen neuer Zahlenwerte gemSie der Umwandlungsformel ftir die 
unzulSssige Einheit und die entsprechende zuiassige Einheit. 

5 

9, Verfahren nach Anspruch 8, bei dem festgestellt wird, dgJ3 eine Zahl der 
Einheit zugeordnet 1st, wenn sie der Bezeichnung fur die Einheit unmittelbar 
vorangeht oder wenn sie init einer anderen Zahl, die der Einheit zugeordnet 
ist ? nur durch Interpunktionszeichen wie Komma, Semikolon, Bindestriche 

10 oder durch WSrter wie "und", "oder", "bis" verbunden 1st. 

10. Verfahren nach Anspruch 8 F bei dem eine Zahl zu derselben syntakti- 
scheri Gruppe geh6rt oder Bestandteil eines Satzes ist, 

15 11. Verfahren nach Anspruch 10, 9 oder 8 , mit den zusatzlichen Schritten: 

- Bestimmen der Toleranz infolge des Rundungsfehlers der Zahl, 

Berechnen der entsprechenden Toleranz des neuen Zahlenwertes gem3£ 
20 der Umwandlungsformel und 

Runden des neuen Wertes auf die gr6J3te Dezimalstelle. fur die der 
Rundungsfehler kleiner list als die berechnete Toleranz, 

25 12, Textverarbeitungssystem zur Prflfung des richtigen und konsistenten Ge- 
brauchs von Einheiten in einem gegebenen Text t nach einem der vorstehen- 
den Ansprttche, 
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